آموزش دریاچه داده در AWS - ساده ترین راه برای یادگیری [2023]

Data Lake in AWS - Easiest Way to Learn [2023]

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: Hands-on - Glue, Athena, S3, ETL, Spark, Parket, QuickSight, Kinesis, Lambda, Comprehend AI درباره مولفه های کلیدی Data Lake در مقابل Data Warehouse اطلاعات فایل های Query معماری Data Lake مستقیماً با استفاده از ادغام SQL Hands-on با استفاده از Kinesis Firehose، Lambda، Comprehend AI، Glue، Athena و S3 پیش نیازها: دانش اولیه AWS مفید است اما اجباری نیست.

سلام، نام من چاندرا لینگام است، و من مربی شما برای دریاچه داده در دوره AWS خواهم بود.

در این دوره، ما با درک مفاهیم اساسی دریاچه داده و اینکه چه زمانی راه حل مناسب در مقابل انبار داده است، شروع خواهیم کرد

سپس به مؤلفه‌های مختلفی که راه‌حل دریاچه داده را تشکیل می‌دهند، از جمله توانایی جستجوی مستقیم فایل‌ها با استفاده از SQL برای تجزیه و تحلیل موقتی سریع مجموعه‌های داده می‌پردازیم.

در طول دوره، موضوع مدیریت تغییرات در ساختار فایل‌ها در دریاچه داده را پوشش خواهیم داد. ما به سناریوهای مختلف مانند فیلدهای جدید، پارتیشن‌های جدید، تغییرات در انواع داده‌ها و داده‌های از دست رفته می‌پردازیم و در مورد تکنیک‌های نحوه مدیریت موثر آنها بحث خواهیم کرد. همچنین با تمرکز بر به حداقل رساندن اختلال در سیستم های پایین دستی، به مدیریت کاتالوگ چسب و تکامل طرحواره ها می پردازیم

ما همچنین به فرمت های مختلف داده مانند CSV، Parquet، Avro و ORC نگاه خواهیم کرد و نقاط قوت و ضعف مربوطه را بررسی خواهیم کرد. پس از آن، به Glue ETL، یک راه حل قوی مبتنی بر اسپارک Apache برای تبدیل داده ها می پردازیم.

این دوره پر از تمرین ها و پروژه های عملی است.

شما یک مجموعه داده رتبه بندی دانشگاه را تجزیه و تحلیل خواهید کرد که درک آن آسان، مفید است و ترکیبی از انواع داده ها با بسیاری از مسائل مربوط به کیفیت داده است.

می‌آموزید که از Athena برای جستجوی داده‌ها استفاده کنید، با مشکلات کیفیت داده‌ها از طریق SQL مقابله کنید، و داده‌ها را با استفاده از Glue - Apache Spark ETL پاک کنید.

به‌علاوه، این دوره تکنیک‌هایی را برای ساده‌سازی پرسش‌ها با استفاده از نماها و تجسم داده‌ها با استفاده از Amazon QuickSight پوشش می‌دهد.

برای نشان دادن مقیاس پذیری آتنا، مجموعه داده بزرگ نظرات مشتریان آمازون را که شامل بیش از 130 میلیون بررسی است، پرس و جو می کنیم. در نهایت، ما یک برنامه بدون سرور با استفاده از Kinesis Firehose، Lambda، Comprehend AI، Glue، Athena و S3 خواهیم ساخت که می تواند تعداد نامحدودی از نظرات مشتریان را پردازش کند، تجزیه و تحلیل احساسات انجام دهد و نتایج را در دریاچه داده برای پرس و جو ذخیره کند.

من مشتاقم که به زودی شما را ملاقات کنم!

متشکرم!

چاندرا لینگام

محاسبه با Cloud Inc


سرفصل ها و درس ها

معرفی Introduction

  • مقدمه ای بر دریاچه داده Introduction to Data Lake

  • منابع قابل دانلود Downloadable Resources

  • سرعت یادگیری را افزایش دهید Increase the speed of learning

  • ذخیره سازی، مصرف داده ها و مهاجرت به دریاچه داده Storage, Data Ingestion and Migration to a Data Lake

  • کاتالوگ داده و مرداب داده Data Catalog and Data Swamp

  • فرمت های داده محبوب Popular Data Formats

  • تبدیل داده ها Data Transformation

  • برای پرسش و پاسخ زنده - هر ماه به ما بپیوندید! Join us for the Live Q&A - Every Month!

  • مصاحبه Udemy - شیرجه عمیق به گواهینامه های AWS Udemy Interview - A Deep Dive Into AWS Certifications

پرس و جو و تجزیه و تحلیل Querying and Analytics

  • ابزارهای پرس و جو و تجزیه و تحلیل در محل In-place Querying and Analytics Tools

  • جریان در مقابل تجزیه و تحلیل دسته ای Streaming vs. Batch Analysis

  • Kinesis - پردازش و تجزیه و تحلیل داده های جریان Kinesis - Process and Analyze Streaming Data

آزمایشگاه - حساب AWS و تنظیمات کاربر Lab - AWS Account and User Setup

  • تنظیمات حساب Account Setup

  • آزمایشگاه - راه اندازی حساب AWS، پیشنهادات ردیف رایگان، صورتحساب، پشتیبانی Lab - AWS Account Setup, Free Tier Offers, Billing, Support

  • آزمایشگاه - هشدارهای صورتحساب، دسترسی نمایندگان Lab - Billing Alerts, Delegate Access

  • آزمایشگاه - کاربر IAM را پیکربندی کنید Lab - Configure IAM User

نظارت، بهینه سازی و امنیت Monitoring, Optimization and Security

  • نظارت و بهینه سازی Monitoring and Optimization

  • آزمایشگاه S3 S3 Labs

  • آزمایشگاه - کلاس های ذخیره سازی S3 Lab - S3 Storage Classes

  • رمزگذاری داده ها Data Encryption

  • امنیت و حفاظت Security and Protection

  • آزمایشگاه - نسخه S3 Lab - S3 Versioning

  • آزمایشگاه - حفظ مبتنی بر سن (مدیریت چرخه زندگی) Lab - Age Based Retention (Lifecycle Management)

  • آزمایشگاه - طبقه بندی ذخیره سازی (مدیریت چرخه زندگی) Lab - Storage Tiering (Lifecycle Management)

  • آزمایشگاه - تکرار (برای بازیابی فاجعه) Lab - Replication (for disaster recovery)

  • آزمایشگاه - رمزگذاری با SSE-S3 و KMS Lab - Encryption with SSE-S3 and KMS

آزمایشگاه - کاتالوگ داده و پرس و جو در محل Lab - Data Catalog and In-place Querying

  • کد منبع دانلود Source Code Download

  • دستورالعمل های آزمایشگاه - کاتالوگ داده های چسب Lab Instructions - Glue Data Catalog

  • آزمایشگاه - کاتالوگ داده های چسب Lab - Glue Data Catalog

  • دستورالعمل های آزمایشگاه - پرس و جو در محل آتنا Lab Instructions – Athena In-place Querying

  • آزمایشگاه - پرس و جو در محل آتنا Lab - Athena In-place Querying

  • آزمایشگاه - بررسی مشتریان آمازون پرس و جو در محل Lab - Amazon Customer Review In-place Querying

ETL را با اسپارک آپاچی بچسبانید Glue ETL with Apache Spark

  • منابع قابل دانلود Downloadable Resources

  • مقدمه خدمات و مقایسه ETL مدیریت شده با چسب Introduction Glue Managed ETL Service and Comparison

  • آزمایشگاه - با استفاده از ویرایشگر ویژوال به قالب پارکت تبدیل کنید Lab - Convert to Parquet Format using Visual Editor

  • داده های رتبه بندی دانشگاه - بررسی اجمالی تجزیه و تحلیل University Rankings Data - Analysis Overview

  • آزمایشگاه - LazySerDe و مسائل Lab - LazySerDe and Issues

  • آزمایشگاه - OpenCSVSerDe و مسائل Lab - OpenCSVSerDe and Issues

  • آزمایشگاه - پاکسازی در زمان پرس و جو (Extract، Load، و سپس Transform) Lab - Cleanup at Query Time (Extract, Load, and then Transform)

  • آزمایشگاه - پنهان کردن پیچیدگی پرس و جو با نماها Lab - Hide Query Complexity with Views

  • آزمایشگاه - آپاچی اسپارک ETL Lab - Apache Spark ETL

  • آزمایشگاه های تجسم QuickSight QuickSight Visualization Labs

  • آزمایشگاه - نحوه ثبت نام برای آزمایشی 30 روزه QuickSight Lab - How to Signup for QuickSight 30-day Trial

  • آزمایشگاه - تجسم QuickSight Lab - QuickSight Visualization

  • آزمایشگاه - نحوه لغو اشتراک QuickSight Lab - How to Cancel QuickSight Subscription

  • تبدیل شدن به یک استاد SQL: آموزش چالش LeetCode Becoming a SQL Master: LeetCode Challenge Tutorials

تکامل طرحواره Schema Evolution

  • منابع قابل دانلود Downloadable Resources

  • چگونه فایل های PARQUET ایجاد کنیم؟ How to create PARQUET files?

  • مدیریت تغییرات طرحواره با فرمت CSV Handling Schema Changes with CSV Format

  • مدیریت تغییرات طرحواره با فرمت PARQUET Handling Schema Changes with PARQUET Format

  • آزمایشگاه - تغییرات طرحواره با CSV Lab - Schema changes with CSV

  • آزمایشگاه - تغییرات طرحواره با PARQUET Lab - Schema changes with PARQUET

  • بهترین روش های سازماندهی داده ها - ساختار پوشه، پارتیشن ها، طبقه بندی Data Organization Best Practices - Folder Structure, Partitions, Classification

  • آزمایشگاه - ایجاد و نگهداری جداول پارتیشن بندی شده Lab - Partitioned Table Creation and Maintenance

  • آزمایشگاه - نگهداری کاتالوگ دستی Lab - Manual Catalog Maintenance

  • آزمایشگاه - پارتیشن بندی سازگار با کندو Lab - Hive Compatible Partitioning

آزمایشگاه - تحلیل احساسات بررسی مشتریان Lab - Customer Review Sentiment Analysis

  • تحلیل احساسات بازبینی مشتری Customer Review Sentiment Analysis

  • آزمایشگاه - خدمات هوش مصنوعی برای تجزیه و تحلیل متن را درک کنید Lab - Comprehend AI Service for Text Analysis

  • آزمایشگاه - نمونه نوت بوک SageMaker Lab - SageMaker Notebook Instance

  • منابع قابل دانلود Downloadable Resources

  • آزمایشگاه - تنظیم کد منبع Lab - Source Code Setup

  • آزمایشگاه - مقدمه پایتون Lab - Python Introduction

  • آزمایشگاه - احساس بررسی مشتری Lab - Sentiment of Customer Review

  • آزمایشگاه - بررسی پرس و جو توسط احساسات Lab - Query Review By Sentiment

آزمایشگاه - برنامه بدون سرور با Kinesis Firehose، Lambda، Comprehend AI، Glue، Lab - Serverless Application with Kinesis Firehose, Lambda, Comprehend AI, Glue,

  • مصرف جریانی داده Streaming Data Consumption

  • برنامه بدون سرور برای تحلیل احساسات بازبینی مشتری Serverless Application for Customer Review Sentiment Analysis

  • تغییرات رابط کاربری Lambda Lambda UI Changes

  • بخش 1 آزمایشگاه - برنامه بررسی مشتری بدون سرور Lab Part 1 - Serverless Customer Review Application

  • بخش 2 آزمایشگاه - برنامه بررسی مشتری بدون سرور Lab Part 2 - Serverless Customer Review Application

نتیجه Conclusion

  • تبریک می گویم! Congratulations!

اختیاری: چرا رایانش ابری؟ Optional: Why Cloud Computing?

  • AWS Cloud Computing و Global Infrastructure AWS Cloud Computing and Global Infrastructure

  • منابع قابل دانلود Downloadable Resources

  • مجموع هزینه مالکیت بین On-premises و Cloud Total Cost of Ownership between On-premises and Cloud

  • مزایای رایانش ابری Benefits of Cloud Computing

  • زیرساخت جهانی AWS AWS Global Infrastructure

نمایش نظرات

آموزش دریاچه داده در AWS - ساده ترین راه برای یادگیری [2023]
جزییات دوره
5.5 hours
75
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
8,676
4.5 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chandra Lingam Chandra Lingam

Compute With Cloud Inc